정확도와 정밀도
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
정확도와 정밀도는 측정이나 예측의 품질을 나타내는 용어이다. 1994년 ISO 표준 시리즈 발표 이후 정확도와 정밀도 용어의 의미가 바뀌었으며, 정확도는 측정값이 참값에 얼마나 가까운지를 나타내고, 정밀도는 반복 측정 시 결과의 일치 정도를 의미한다. 측정 시스템은 정확하지만 정밀하지 않거나, 정밀하지만 정확하지 않을 수 있으며, 통계학에서는 정확도와 정밀도 대신 편향과 변동성이라는 용어를 사용한다. 이진 분류에서 정확도는 테스트가 조건을 얼마나 정확하게 식별하는지를 나타내는 척도이며, 다중 클래스 분류에서는 올바른 분류의 비율을 의미한다. 한국에서는 전문 용어 번역 시 precision은 정밀로, precise 또는 high precision은 고정밀로 번역된다.
더 읽어볼만한 페이지
- 정확도와 정밀도 - 민감도와 특이도
민감도와 특이도는 의학적 진단에서 검사의 정확성을 평가하는 지표로, 민감도는 실제 양성인 대상 중 양성으로 나타나는 비율, 특이도는 실제 음성인 대상 중 음성으로 나타나는 비율을 의미하며, 선별 검사에서 두 지표를 모두 높여 질병을 정확하게 진단하는 것을 목표로 한다. - 정확도와 정밀도 - 교정 (공학)
교정(공학)은 측정 장비의 정확성을 확보하고 측정 결과를 국가 표준에 부합하도록 보장하는 과정으로, 국제도량형국은 이를 측정 표준과 교정 대상 기기 간의 관계 설정 및 측정 불확도 고려 과정으로 정의하며, 제품 및 서비스 품질 향상과 법규 준수를 위해 요구되고, 한국에서는 국가기술표준원이 관련 업무를 총괄하며 특정 분야에서는 기기의 정확한 표시를 위한 조정 과정도 포함한다. - 통계 이론 - 로지스틱 회귀
로지스틱 회귀는 범주형 종속 변수를 다루는 회귀 분석 기법으로, 특히 이항 종속 변수에 널리 사용되며, 오즈에 로짓 변환을 적용하여 결과값이 0과 1 사이의 값을 가지도록 하는 일반화 선형 모형의 특수한 경우이다. - 통계 이론 - 정보 엔트로피
정보 엔트로피는 확률 변수의 불확실성을 측정하는 방법으로, 사건 발생 가능성이 낮을수록 정보량이 커진다는 원리에 기반하며, 데이터 압축, 생물다양성 측정, 암호화 등 다양한 분야에서 활용된다. - 심리측정학 - 재현성
재현성은 과학적 연구의 신뢰성을 평가하는 요소로, 동일한 조건에서 유사한 결과를 얻을 수 있는 정도를 의미하며, 실험 방법과 데이터의 투명한 공개를 통해 확보해야 한다. - 심리측정학 - 조작주의
조작주의는 과학적 개념을 측정 과정을 통해 정의하는 과학적 실천 방법으로, 물리학에서 시작되어 다양한 분야에서 활용되지만, 경제학에서는 주관적인 개념을 정당화하는 데 사용된다는 비판과 함께 복잡한 사회 현상에 대한 신중한 검토가 필요하다.
정확도와 정밀도 | |
---|---|
측정 및 통계 | |
정확도 (Accuracy) | 측정값들이 참값 또는 기준값과 얼마나 가까운지를 나타내는 개념이다. 높은 정확도는 낮은 체계적 오류를 의미한다. |
정밀도 (Precision) | 반복적인 측정에서 얻은 측정값들이 서로 얼마나 가까운지를 나타내는 개념이다. 높은 정밀도는 낮은 임의 오차를 의미한다. |
편향 (Bias) | 측정값들의 평균이 참값 또는 기준값에서 벗어난 정도를 나타내는 체계적 오류의 척도이다. |
불확실성 (Uncertainty) | 측정 결과에 대한 의심의 정도를 나타내는 파라미터이다. |
모호성 (Ambiguity) | 측정 결과가 명확하게 정의되지 않거나 해석하기 어려운 정도를 나타낸다. |
추가 설명 | |
설명 | 정확도는 측정의 '정확성'을 나타내고, 정밀도는 측정의 '일관성'을 나타낸다. 측정 시스템의 정확도는 시스템의 편향과 정밀도와 관련이 있다. |
2. 역사적 배경
(내용을 작성할 원본 소스가 제공되지 않았습니다. '역사적 배경' 섹션에 해당하는 원본 자료를 제공해주시면 내용을 작성해 드리겠습니다.)
2. 1. ISO 표준 정의
1994년에 ISO 5725 표준 시리즈가 발표되면서 정확도와 정밀도 용어의 의미가 바뀌었고, 이는 2008년 BIPM 국제 계량 용어집(VIM)의 항목 2.13 및 2.14에도 반영되어 있다.[2]ISO 5725-1에 따르면, 일반적인 용어인 정확도(accuracy)는 측정값이 참값에 얼마나 가까운지를 설명하는 데 사용된다. 이 용어가 동일한 측정 대상의 측정 집합에 적용될 때, 정확도는 무작위 오차와 체계적 오차의 영향을 모두 포함한다. 이 경우 진도(trueness)는 측정 결과들의 평균이 실제 (참) 값에 얼마나 가까운지를 나타내는 체계적 오차와 관련되고, 정밀도(precision)는 측정 결과들 사이의 일치 정도, 즉 무작위 오차를 의미한다.
ISO 5725-1 및 VIM은 또한 BS 5497-1에서 이전에 사용되었던 "편향"(bias)이라는 용어의 사용을 피하는데,[6] 이는 이 용어가 의학 및 법률과 같이 과학 및 공학 분야 밖에서 다른 의미를 갖기 때문이다.
BIPM 및 ISO 5725에 따른 정확도 개념은 표적 집단에 비유하여 설명할 수 있다:
이상적인 측정 장비는 정확하고 정밀하며, 측정 결과는 참값에 매우 가깝고 반복 측정 시 매우 좁은 범위의 값을 나타낸다.

측정의 정확도와 정밀도를 확립하기 위해서는, 참조 표준이 되는 추적 가능한 대상을 반복적으로 측정해야 한다. 이러한 표준은 국제 단위계(SI)로 정의되며, 각국의 국가 계량 표준 기관(한국의 경우 한국표준과학연구원)이 관리하고 유지한다.
3. 정확도와 정밀도의 정의
동일한 양을 반복 측정하여 얻은 통계적 표본이나 데이터 집합이 있을 때, 그 평균값이 측정하려는 양의 실제 값에 가까우면 '''정확하다'''고 하며, 표준 편차가 비교적 작으면 '''정밀하다'''고 할 수 있다.
과학 및 공학 분야에서 측정 시스템의 정확도(Accuracy|정확도eng)는 측정값이 해당 수량의 실제 값에 얼마나 가까운지를 나타내는 정도이다.[2] 반면, 정밀도(Precision|정밀도eng)는 재현성 및 반복성과 관련하여, 변경되지 않은 조건에서 반복 측정했을 때 결과들이 서로 얼마나 가깝게 일치하는지를 나타낸다.[2][3] 일상 대화에서는 이 두 단어가 동의어처럼 쓰이기도 하지만, 과학적 방법의 맥락에서는 의도적으로 구분하여 사용한다.
통계학 분야에서는 정확도와 정밀도 대신 ''편향''(Bias|편향eng)과 ''변동성''(Variability|변동성eng)이라는 용어를 사용하기도 한다. 편향은 부정확성의 정도를, 변동성은 비정밀성의 정도를 나타낸다.
측정 시스템은 정확하지만 정밀하지 않을 수도 있고, 정밀하지만 정확하지 않을 수도 있으며, 둘 다 아닐 수도 있고, 둘 다일 수도 있다. 예를 들어, 실험에 체계적 오차가 있다면 표본 크기를 늘려도 정밀도만 높아질 뿐 정확도는 개선되지 않을 수 있다. 측정 시스템은 ''정확''하고 ''정밀''할 때 ''유효하다''(Valid|유효하다eng)고 간주된다.
ISO 5725-1 표준과 BIPM 국제 계량 용어집(VIM)에서는 '정확도'를 측정값이 참값에 얼마나 가까운지를 설명하는 포괄적인 용어로 사용하며, 이는 무작위 오차(정밀도)와 체계적 오차(진도) 요소를 모두 포함한다. 여기서 진도(Trueness|진도eng)는 측정 결과들의 평균이 실제 (참) 값에 얼마나 가까운지, 즉 체계적 오차의 정도를 나타낸다.[2] ISO 5725-1 및 VIM은 과학 및 공학 외 분야에서 다른 의미를 가질 수 있는 '편향'이라는 용어 사용을 피한다.[6]
정확도와 정밀도의 차이는 과녁 맞히기에 비유하여 간단히 설명할 수 있다. 정확도는 화살들이 과녁의 중심(참값)에 얼마나 가깝게 맞는지를, 정밀도는 여러 발의 화살들이 서로 얼마나 가깝게 모여 있는지를 의미한다.
정확도와 정밀도 외에도, 측정값은 측정 해상도(Resolution)를 가질 수 있는데, 이는 측정에서 반응을 일으키는 기본 물리량의 가장 작은 변화를 의미한다. 수치 해석에서는 정확도를 계산값이 실제 값에 얼마나 가까운지로, 정밀도를 표현의 해상도(예: 십진수나 이진수의 자릿수)로 정의한다. 군사 용어에서 정확도는 주로 사격의 정밀도, 즉 표적 중심과 탄착군의 근접성을 의미한다.[4]
3. 1. 정확도 (Accuracy)
과학 및 공학 분야에서 측정 시스템의 정확도는 수량의 측정이 해당 수량의 실제 값에 얼마나 가까운지를 나타내는 정도이다.[2] 이는 측정의 결과가 참값에서 벗어나는 정도를 의미하며, 체계적 오차와 밀접한 관련이 있다. 측정 시스템은 정확하지만 정밀하지 않을 수도 있고, 정밀하지만 정확하지 않을 수도 있으며, 둘 다 아닐 수도 있고, 둘 다일 수도 있다. 예를 들어, 실험에 체계적 오차가 포함되어 있다면, 표본 크기를 늘리면 일반적으로 정밀도는 증가하지만 정확도는 개선되지 않는다. 그 결과 결함이 있는 실험에서 일관성이 있지만 부정확한 일련의 결과가 나타난다. 체계적 오차를 제거하면 정확도가 개선되지만 정밀도는 변경되지 않는다.[2][3]통계학 분야에서는 정확도 대신 ''편향''이라는 용어를 사용하기도 한다. 편향은 부정확성의 양을 나타낸다. 측정 시스템은 ''정확''하고 ''정밀''할 경우 ''유효하다''고 간주된다. 관련 용어로는 ''편향'' (무작위 또는 독립 변수와 관련이 없는 요인에 의해 발생하는 방향성 효과) 및 ''오차'' (무작위 변동성)가 있다. 이 용어는 간접 측정, 즉 관찰된 데이터로부터 계산 절차에 의해 얻어진 값에도 적용된다.
1994년에 발표된 ISO 5725 표준 시리즈와 2008년 BIPM 국제 계량 용어집(VIM)에서는 '정확도'를 측정값이 참값에 얼마나 가까운지를 설명하는 일반적인 용어로 정의한다.[2] 동일한 측정 대상의 측정 집합에 이 용어를 적용할 때는 무작위 오차(정밀도)와 체계적 오차(진도)의 구성 요소를 모두 포함한다. 여기서 진도(trueness|진도영어)는 일련의 측정 결과의 평균이 실제 (참) 값에 얼마나 가까운지, 즉 체계적 오차의 정도를 나타낸다. ISO 5725-1 및 VIM은 과학 및 공학 분야 밖에서 다른 의미를 가질 수 있는 "편향"이라는 용어 사용을 피한다.[6]
정확도는 과녁 맞히기에 비유하여 설명할 수 있다. 과녁의 중심을 참값이라고 할 때, 화살이 과녁 중심에 얼마나 가깝게 맞았는지가 정확도에 해당한다. 즉, 어떤 시스템의 측정값이 본래의 값에 가까울수록 그 시스템의 정확도가 높다고 할 수 있다. 여러 발의 화살이 모두 과녁 중심에 매우 가깝게 맞았다면 정확도가 높은 것이다. 반면, 화살들이 과녁 중심에서 벗어난 곳에 모여 있다면 (정밀도는 높지만) 정확도는 낮다고 할 수 있다. 만약 화살들이 여기저기 흩어져 맞았다면(정밀도가 낮다면), 개별 화살들이 중심에 가깝다고 말하기 어렵기 때문에 정확도가 높다고 보기 어렵다. 평균적으로는 중심에 가까울 수 있지만, 개별 측정의 신뢰성을 확보하기 위해서는 정밀도 또한 중요하다.
정확도에 관해서는 다음 사항을 구별할 수 있다.
- 측정값의 평균과 표준값(참값)의 차이, 즉 편향. 이 값을 확정하고 보정하는 것은 교정에서 필수적이다.
- 편향과 정밀도가 합성된 영향.
과학 및 공학 분야에서는 정확도와 정밀도를 유효 숫자로 암시하는 경우가 많다. 명시적으로 오차 범위가 주어지지 않으면, 최소 유효 자릿수의 절반을 오차 범위로 간주한다. 예를 들어, 843.6 m라고 기록했다면 오차 범위는 0.05 m로 볼 수 있고, 8436 m라고 기록했다면 오차 범위는 0.5 m로 간주한다. 값이 8.0 ×103 m 와 같이 표기되면 오차 범위가 50 m임을 나타낸다.
정확도는 측정값과 참값 사이의 차이인 오차의 절대적인 크기뿐만 아니라, 측정하는 양 자체의 크기와도 관련이 있다. 따라서 상대 오차라는 개념이 자주 사용된다.
: 상대 오차 = 오차 / 참값 (또는 최확값)
예를 들어, 동일한 측정을 여러 번 반복했을 때의 표준 편차를 오차로, 측정값들의 평균을 최확값으로 간주하여 계산한 상대 오차를 상대 표준 편차(RSD, Relative Standard Deviation|상대 표준 편차영어)라고 한다.
: RSD = 표준 편차 / 평균값
3. 2. 정밀도 (Precision)
정밀도(Precision)는 동일한 양을 반복 측정했을 때 각 측정값 또는 예측값들이 서로 얼마나 일관성 있게 가깝게 모여 있는지를 나타내는 척도이다.[2][3] 이는 통계학에서 변동성과 유사한 개념이며, 측정 과정에서의 무작위 오차와 깊은 관련이 있다. 표준 편차가 작을수록 정밀도는 높다고 할 수 있다.과학 및 공학 분야에서 정밀도는 측정 시스템의 반복성(Repeatability) 및 재현성(Reproducibility)과 관련된다. 즉, 변경되지 않은 조건에서 반복하여 측정했을 때 동일한 결과를 얼마나 잘 보여주는지를 의미한다.[2][3] 정밀도는 정확도와는 다른 개념으로, 과학적 방법의 맥락에서는 의도적으로 구분하여 사용한다. 측정 시스템은 정밀하지만 정확하지 않을 수도 있고, 그 반대일 수도 있으며, 둘 다 높거나 낮을 수도 있다. 예를 들어, 실험 과정에 체계적 오차가 포함되어 있다면, 표본 크기를 늘려 반복 측정을 많이 할수록 결과값들은 서로 더 가깝게 모이게 되어 정밀도는 증가하지만, 참값에서 벗어난 정도(부정확성)는 개선되지 않는다.
정확도와 정밀도의 차이는 과녁 맞히기 비유를 통해 쉽게 이해할 수 있다. 반복 측정하는 행위를 과녁에 여러 발의 화살을 쏘는 것에 비유할 때, 정밀도는 여러 발의 화살이 서로 얼마나 가깝게 모여 맞는지를 나타낸다. 화살들이 과녁 중심(참값)에서 멀리 떨어져 있더라도 서로 좁은 범위 안에 모여 있다면 정밀도는 높다고 할 수 있다. 따라서 정밀도가 높다고 해서 반드시 정확도가 높은 것은 아니다.[4] 하지만 개별 측정값의 정확도를 신뢰할 수 있으려면, 즉 개별 화살이 과녁 중심에 가깝다고 말하려면, 먼저 여러 발의 화살이 한 곳에 모이는 높은 정밀도가 전제되어야 한다. 화살이 여기저기 흩어져 맞는다면(정밀도가 낮다면) 개별 화살이 중심에 가깝다고 보기 어렵기 때문이다.
ISO 5725-1 표준에 따르면, 동일한 측정 대상에 대한 측정 집합에 적용될 때 정밀도는 측정 결과들 사이의 일치 정도, 즉 무작위 오차의 크기를 나타낸다.[2]
과학 및 공학 분야에서는 유효 숫자를 사용하여 정밀도를 암시적으로 표현하기도 한다. 명시적으로 오차 범위가 주어지지 않은 경우, 오차 범위는 마지막 유효 자릿수의 절반으로 간주된다. 예를 들어, 측정값이 8.0으로 기록되었다면 이는 소수점 첫째 자리까지 측정되었으며 그 값이 0임을 의미한다. 이는 단순히 8로 기록된 값보다 더 정밀한 측정임을 나타낸다(이때 실제 참값은 9.5일 수도 있으므로 정확도와는 별개이다). 즉, 정밀도는 측정값 자체의 상세함 또는 측정 과정의 일관성을 나타낸다고 할 수 있다.
정밀도는 다음과 같은 하위 개념으로 분류될 수 있다:
- '''반복성'''(Repeatability): 동일한 조건(동일 측정 장비, 동일 측정자, 짧은 시간 간격 등)에서 측정을 반복했을 때 결과들이 서로 일치하는 정도를 의미한다.
- '''재현성'''(Reproducibility): 서로 다른 조건(다른 측정 장비, 다른 측정자, 다른 장소 등)에서 동일한 측정 방법을 사용하여 측정을 수행했을 때 결과들이 서로 일치하는 정도를 의미한다.
3. 3. 정확도와 정밀도의 관계
동일한 양을 반복 측정하여 얻은 통계적 표본이나 데이터 집합이 있을 때, 그 평균이 측정하려는 양의 실제 값에 가까우면 '''정확하다'''고 하고, 표준 편차가 비교적 작으면 '''정밀하다'''고 한다.[2] 과학 및 공학 분야에서 측정 시스템의 정확도는 측정값이 실제 값에 얼마나 가까운지를 나타내는 정도이며, 정밀도는 변경되지 않은 조건에서 반복 측정했을 때 동일한 결과를 얼마나 일관되게 보여주는지를 나타낸다.[2][3] 일상 대화에서는 이 두 단어가 동의어처럼 사용될 수 있지만, 과학적 방법의 맥락에서는 의도적으로 구분하여 사용한다.측정 시스템은 정확하지만 정밀하지 않을 수도 있고, 정밀하지만 정확하지 않을 수도 있으며, 둘 다 아닐 수도 있고, 둘 다일 수도 있다. 예를 들어, 실험에 체계적 오차가 포함되어 있다면, 표본 크기를 늘리면 일반적으로 정밀도는 증가하지만 정확도는 개선되지 않는다. 그 결과, 결함이 있는 실험에서는 일관성 있지만 부정확한 결과들이 나타날 수 있다. 반대로 체계적 오차를 제거하면 정확도는 개선되지만 정밀도는 변하지 않을 수 있다. 측정 시스템은 ''정확''하고 ''정밀''할 경우 ''유효하다''고 간주된다.
정확도와 정밀도의 차이는 과녁 맞히기에 비유하여 설명할 수 있다. 여기서 반복 측정은 과녁을 향해 화살을 여러 번 쏘는 것에 해당한다.
- '''정확도'''는 화살들이 과녁의 중심에 얼마나 가깝게 맞는지를 나타낸다. 화살들이 평균적으로 중심에 가까울수록 정확도가 높다고 할 수 있다. 즉, 어떤 시스템의 측정값이 실제 값에 가까울수록 그 시스템의 정확도가 높다고 할 수 있다.
- '''정밀도'''는 여러 번 쏜 화살들이 서로 얼마나 가깝게 모여 있는지를 나타낸다. 화살들이 매우 좁은 범위 안에 모여 있다면 정밀도가 높다고 하며, 이 범위가 과녁의 중심에서 얼마나 떨어져 있는지는 상관없다. 따라서 정밀도가 높은 측정이 반드시 정확도가 높다고는 할 수 없다.
그러나 개별 측정의 정확도가 신뢰할 수 있으려면 정밀도가 높아야 한다. 만약 화살들이 과녁 여기저기에 흩어져 맞는다면, 비록 평균적으로는 중심에 가깝다고 하더라도 개별 화살 하나하나가 정확하다고 말하기는 어렵다.
이상적인 측정 장비는 정확하고 정밀하여, 모든 측정값이 실제 값에 매우 가깝고 동시에 서로 조밀하게 모여 있어야 한다. 측정 과정의 정확도와 정밀도는 일반적으로 몇 가지 추적 가능한 기준 기술 표준을 반복적으로 측정하여 설정된다. 이러한 표준들은 Système international d'unités|국제 단위계프랑스어(SI)로 정의되며, 미국의 국립 표준 기술 연구소(NIST)나 한국표준과학연구원과 같은 국가 표준 기구에서 유지 관리한다.
4. 정확도와 정밀도의 정량화
동일한 대상을 반복 측정하여 얻은 통계적 표본이나 데이터 집합이 있을 때, 그 결과의 평균이 실제 값에 가까우면 정확하다고 하고, 결과값들의 표준 편차가 작아 서로 모여 있으면 정밀하다고 할 수 있다. 과학 및 공학 분야에서 측정 시스템의 정확도는 측정값이 실제 값에 얼마나 가까운지를 나타내며[2], 정밀도는 변경되지 않은 조건에서 반복 측정했을 때 동일한 결과를 얼마나 일관되게 보여주는지를 의미한다.[2][3] 일상 대화에서는 두 단어가 비슷하게 쓰일 수 있지만, 과학적 방법에서는 명확히 구분되는 개념이다.
통계학에서는 정확도와 정밀도 대신 편향(bias)과 변동성(variability)이라는 용어를 선호한다. 편향은 부정확성의 정도를, 변동성은 비정밀성의 정도를 나타낸다.
측정 시스템은 정확하지만 정밀하지 않을 수도 있고, 정밀하지만 정확하지 않을 수도 있으며, 둘 다 아닐 수도 있고, 둘 다일 수도 있다. 예를 들어, 실험에 체계적 오차가 포함되어 있다면, 표본 크기를 늘리면 일반적으로 정밀도는 증가하지만 정확도는 개선되지 않는다. 체계적 오차를 제거하면 정확도가 개선되지만 정밀도는 변경되지 않을 수 있다. 측정 시스템이 정확하고 정밀할 때 유효하다(valid)고 간주한다. 관련 용어로는 특정 요인에 의한 방향성 효과인 편향과 무작위적 변동인 오차가 있다. 이러한 용어는 직접 측정값뿐만 아니라 관찰된 데이터로부터 계산된 간접 측정값에도 적용된다.
정확도와 정밀도 외에, 측정에는 측정 해상도(resolution)도 있는데, 이는 측정값이 반응하는 대상의 가장 작은 변화량을 의미한다.
분야별 의미:
- 수치 해석: 정확도는 계산값이 실제 값에 얼마나 가까운지, 정밀도는 표현의 해상도(보통 십진수나 이진수 자릿수)를 의미한다.
- 군사 용어: 정확도는 주로 사격 정확도(justesse de tir|쥐스테스 드 티르프랑스어)를 뜻하며, 정밀도는 표적 중심 주변에 형성된 탄착군의 밀집도를 의미한다.[4]
- 산업 계측: 정확도는 측정 공차, 즉 기기가 정상 작동 조건에서 발생할 수 있는 오차의 한계를 정의한다.[7]
이상적인 측정 장비는 정확하고 정밀하여 모든 측정값이 실제 값에 가깝고 서로 조밀하게 모여 있어야 한다. 측정 과정의 정확도와 정밀도는 일반적으로 추적 가능한 기준 기술 표준을 반복적으로 측정하여 설정한다. 이러한 표준은 국제 단위계(SI)로 정의되며, 미국의 국립 표준 기술 연구소(NIST)나 한국의 한국표준과학연구원(KRISS) 같은 국가 표준 기구에서 관리한다.
측정값을 반복하여 평균을 내는 경우, 평균값의 정밀도는 개별 측정의 정밀도보다 높아지며, 이때는 표준 오차라는 용어가 사용된다. 중심 극한 정리에 따라, 측정 횟수가 많아질수록 평균값의 확률 분포는 개별 측정값의 분포보다 정규 분포에 더 가까워진다.
4. 1. 정확도의 정량화
측정값의 평균과 기준값(참값)의 차이를 편향이라고 한다. 편향을 정확히 파악하고 이를 수정하는 과정은 교정 작업에서 매우 중요하다. 정확도는 이러한 편향과 측정의 정밀도가 함께 영향을 미친 결과로 이해할 수 있다.과학이나 공학 분야에서는 측정값의 유효 숫자를 통해 정확도나 정밀도를 암시적으로 나타내는 경우가 많다. 별다른 언급이 없다면, 오차의 범위는 마지막 유효 자릿수의 절반으로 간주한다. 예를 들어, '843.6 m', '843.0 m', '800.0 m'와 같이 소수점 아래까지 기록된 값은 마지막 유효 숫자가 소수 첫째 자리이므로 오차 범위가 ±0.05 m임을 의미한다. 반면 '843 m'와 같이 기록된 경우, 마지막 유효 숫자가 일의 자리이므로 오차 범위는 ±0.5 m가 된다.
하지만 '8,000 m'와 같이 소수점 없이 끝에 0이 오는 경우에는 그 0들이 유효 숫자인지 아닌지 불분명하여 오차 범위를 판단하기 어렵다는 문제가 있다. 이러한 모호성을 피하고자 과학적 표기법을 사용한다. 예를 들어 '8.0 × 103 m'는 소수점 아래 첫 번째 0까지 유효 숫자로 취급하여 오차 범위가 ±50 m임을 나타낸다. 만약 '8.000 × 103 m'로 표기한다면, 세 개의 0 모두 유효 숫자로 간주되어 오차 범위는 ±0.5 m가 된다. 비슷하게 기본 측정 단위의 배수를 사용하여 '8km'로 표기하는 것도 '8.0 × 103 m'와 같이 오차 범위가 ±0.05km (즉, 50 m)임을 나타낸다. 그러나 이러한 표기 규칙을 따르지 않는 자료를 인용할 때는 거짓 정밀도 오류가 발생할 수 있으므로 주의해야 한다.[7]
측정 결과의 오차 범위를 더 명확하게 나타내고 싶을 때는 '7.54398(23) × 10−10 m'와 같은 표기법을 사용하기도 한다. 이는 측정값이 7.54375 × 10−10 m에서 7.54421 × 10−10 m 사이의 범위에 있다는 것을 의미한다.
측정값의 정확도를 평가할 때는 오차의 절대적인 크기뿐만 아니라 측정 대상의 크기 자체를 고려하는 것이 중요하다. 이를 위해 상대 오차 개념이 사용된다. 상대 오차는 다음과 같이 계산한다.
: 상대 오차 = 오차 / 참값 (또는 최확값)
특히 같은 측정을 여러 번 반복했을 때, 측정값들의 표준 편차를 오차로, 평균값을 최확값으로 사용하여 계산한 상대 오차를 상대 표준 편차 (RSD, Relative Standard Deviation)라고 부른다.
: RSD = 표준 편차 / 평균값
4. 2. 정밀도의 정량화
정밀도는 측정값들이 서로 얼마나 가까운지를 나타내는 척도로, 여러 방식으로 정량화할 수 있다.측정의 표준 편차는 정밀도를 나타내는 일반적인 지표로 사용되며, 때로는 측정의 표준 오차라고도 불린다. 표준 편차(σ)는 측정값의 흩어짐 정도를 보여주며, 이를 통해 신뢰 구간을 설정할 수 있다. 충분한 횟수의 측정이 이루어지고 측정 오차에 편향이 없다고 가정하면, 통계적으로 다음과 같은 관계가 성립한다.
- 측정값의 약 68.3%가 평균값 ± 1표준 편차(1σ) 범위 내에 존재한다. (1σ 신뢰 구간)
- 측정값의 약 95.4%가 평균값 ± 2표준 편차(2σ) 범위 내에 존재한다. (2σ 신뢰 구간)
- 측정값의 약 99.7%가 평균값 ± 3표준 편차(3σ) 범위 내에 존재한다. (3σ 신뢰 구간)
측정값을 여러 번 반복하여 평균을 내는 경우, 이 평균값의 정밀도는 개별 측정값의 정밀도보다 높아진다. 이때 평균값의 정밀도를 나타내는 지표로 표준 오차가 사용된다. 표준 오차는 개별 측정값의 표준 편차를 측정 횟수의 제곱근으로 나눈 값과 같다. 중심 극한 정리에 따르면, 측정 횟수가 많아질수록 평균값의 확률 분포는 개별 측정값의 분포 형태와 관계없이 정규 분포에 가까워진다.
과학이나 공학 분야에서는 유효 숫자를 사용하여 정밀도를 암시적으로 나타내는 관례가 있다. 별도의 오차 범위가 명시되지 않았다면, 마지막 유효 자릿수의 절반을 오차 한계로 간주한다.
- 예를 들어, 843.6m, 843m, 800m와 같이 소수점 아래까지 기록된 값은 마지막 유효 숫자가 소수 첫째 자리이므로 오차 한계를 ±0.05m로 본다.
- 반면, 843m와 같이 기록된 값은 마지막 유효 숫자가 일의 자리이므로 오차 한계를 ±0.5m로 본다.
소수점 없이 뒤에 0이 오는 경우(예: 8000m)는 유효 숫자가 어디까지인지 모호할 수 있다. 이런 모호성을 피하기 위해 과학적 표기법을 사용한다.
- 8.0 × 103 m는 소수 첫째 자리 '0'까지 유효하다는 의미이며, 오차 한계는 ±50m이다.
- 8.000 × 103 m는 소수 셋째 자리 '0'까지 유효하다는 의미이며, 오차 한계는 ±0.5m이다.
- 기본 단위의 배수를 사용하는 것도 방법이다. 8km는 8.0 × 103 m와 같으며, 오차 한계는 ±0.05km (즉, ±50m)이다.
- 그러나 이러한 유효 숫자 관례를 따르지 않는 자료를 사용할 경우, 잘못된 정밀도 오류가 발생할 수 있으므로 주의해야 한다.
더 명확하게 오차 한계를 표시해야 할 때는 괄호 안에 불확실성을 표기하는 방식을 사용하기도 한다. 예를 들어, 7.54398(23) × 10−10 m는 측정값이 7.54375 × 10−10 m에서 7.54421 × 10−10 m 사이의 범위에 있다는 것을 의미한다 (마지막 두 자리에 ±0.00023 × 10−10 m의 불확실성이 있다는 뜻).
정밀도는 사용되는 조건에 따라 다음과 같이 구분하기도 한다.
- '''반복성''' (repeatability|영어): 동일한 측정 기기, 동일한 작업자가 짧은 시간 동안 동일한 대상을 반복 측정했을 때 결과가 일치하는 정도.
- '''재현성''' (reproducibility|영어): 서로 다른 측정 기기나 작업자가 동일한 측정 방법을 사용하여 동일한 대상을 측정했을 때, 또는 측정 시간 간격이 길어졌을 때 결과가 일치하는 정도.
공학 분야에서는 종종 정밀도를 측정값의 표준 편차의 3배(3σ)로 정의하기도 한다. 이는 측정값의 99.73%가 포함될 것으로 기대되는 범위를 의미한다.[8]
5. 분야별 정확도와 정밀도
정확도와 정밀도의 개념은 다양한 학문 및 응용 분야에서 중요한 기준으로 활용된다. 하지만 각 분야의 특성과 목적에 따라 용어의 정의나 강조점이 조금씩 다르게 사용될 수 있다.
- 과학 및 공학: 측정값과 실제 참값의 근접성(정확도) 및 반복 측정 시 결과의 일관성(정밀도)을 평가하는 기본적인 척도로 사용된다.
- 통계학: 정확도와 정밀도 대신 각각 편향(bias)과 변동성(variability)이라는 용어를 사용하여 측정의 오류를 분석한다.
- 분류 문제 (이진 분류, 다중 클래스 분류): 모델 또는 테스트가 얼마나 올바르게 대상을 분류하는지를 평가하는 성능 지표로 '정확도'가 사용된다. 이는 전체 예측 중 올바른 예측(참 긍정 + 참 부정)의 비율을 의미하며, 정보 검색 분야의 '정밀도'와는 다른 개념이다.
- 논리 시뮬레이션: 시뮬레이션 모델이 실제 회로의 동작을 얼마나 잘 반영하는지(정확도)와 모델 자체의 상세함(정밀도)을 구분하여 평가한다.
- 정보 시스템 및 정보 검색: 검색된 정보의 관련성을 평가하는 주요 지표로 정밀도(검색 결과 중 관련 정보 비율)와 재현율(전체 관련 정보 중 검색된 비율)을 사용한다. '정확도'는 전체 항목 중 올바르게 판단된 비율을 의미하지만, 이 분야에서는 정밀도/재현율만큼 자주 사용되지는 않는다.
- 인지 시스템: 인간이나 인공 시스템의 인지 과정 결과가 의도한 목표에 얼마나 부합하는지(인지 정확도)와 반복 수행 시 얼마나 일관된 결과를 내는지(인지 정밀도)를 측정하는 데 사용된다.
이처럼 정확도와 정밀도는 분야별 맥락에 따라 그 의미와 중요성이 달라지므로, 해당 분야의 정의를 명확히 이해하고 사용하는 것이 중요하다.
5. 1. 과학 및 공학
과학 및 공학 분야에서 측정 시스템의 정확도(accuracy)는 측정한 수량이 해당 수량의 실제 값에 얼마나 가까운지를 나타내는 정도이다.[2] 반면, 정밀도(precision)는 재현성 및 반복성과 관련하여, 변경되지 않은 조건에서 반복 측정했을 때 동일한 결과를 얻는 정도를 의미한다.[2][3] 일상 대화에서는 이 두 단어가 비슷하게 사용될 수 있지만, 과학적 방법에서는 명확히 구분되는 개념이다.통계학에서는 정확도와 정밀도 대신 편향(bias)과 변동성(variability)이라는 용어를 사용하기도 한다. 편향은 부정확성의 정도를, 변동성은 비정밀성의 정도를 나타낸다.
측정 시스템은 다음 네 가지 상태 중 하나일 수 있다.
- 정확하지만 정밀하지 않음
- 정밀하지만 정확하지 않음
- 정확하지도 정밀하지도 않음
- 정확하고 정밀함
예를 들어, 실험에 체계적 오차가 있다면 표본 크기를 늘려도 정밀도만 높아질 뿐 정확도는 개선되지 않는다. 이는 결함 있는 실험에서 일관되지만 부정확한 결과를 낳는다. 체계적 오차를 제거하면 정확도가 개선되지만 정밀도는 그대로 유지될 수 있다. 측정 시스템이 정확하고 정밀할 때 유효하다(valid)고 간주한다. 관련 용어로는 측정 결과에 방향성 영향을 주는 편향과 무작위 변동성을 의미하는 오차(error)가 있다. 이러한 개념은 관찰된 데이터로부터 계산 절차를 통해 얻는 간접 측정값에도 적용된다.
정확도와 정밀도 외에, 측정값은 측정 해상도(resolution)를 가질 수도 있는데, 이는 측정에서 반응을 일으키는 가장 작은 물리량 변화를 의미한다.
수치 해석 분야에서는 정확도를 계산값이 실제 값에 얼마나 가까운지로, 정밀도를 표현의 해상도(보통 십진수나 이진수 자릿수)로 정의한다.
산업 계측에서는 정확도를 측정 공차, 즉 기기가 정상 작동 조건에서 발생할 수 있는 오류의 한계로 정의하기도 한다.[7]
이상적인 측정 장치는 정확하고 정밀하여 모든 측정값이 실제 값에 가깝고 서로 조밀하게 모여 있어야 한다. 측정 과정의 정확도와 정밀도는 일반적으로 몇 가지 추적 가능한 기준 기술 표준을 반복적으로 측정하여 설정된다. 이러한 표준은 SI 단위계(Système international d'unités|SIfra)로 정의되며, 미국의 국립 표준 기술 연구소(NIST)나 한국의 한국표준과학연구원(KRISS)과 같은 국가 표준 기구에서 유지 관리한다.
측정값을 반복하여 평균을 낼 때도 정확도와 정밀도의 개념이 적용된다. 이 경우 평균값의 정밀도는 표준 오차로 표현되며, 이는 개별 측정값의 알려진 표준 편차를 측정 횟수의 제곱근으로 나눈 값과 같다. 중심 극한 정리에 따르면, 측정 횟수가 많아질수록 평균값의 확률 분포는 개별 측정값의 분포보다 정규 분포에 더 가까워진다.
정확도와 관련하여 다음을 구분할 수 있다.
과학 및 공학에서는 유효 숫자를 사용하여 정확도나 정밀도를 암시적으로 나타내는 경우가 많다. 명시적으로 오차 한계가 주어지지 않으면, 마지막 유효 자릿수의 절반 값을 오차 한계로 간주한다. 예를 들어, 843.6m, 843m, 800m는 오차 한계가 0.05m임을 의미한다 (마지막 유효 숫자가 소수점 첫째 자리). 반면, 843m는 오차 한계가 0.5m임을 의미한다 (마지막 유효 숫자가 일의 자리).
8m와 같이 소수점 없이 끝나는 0이 있는 경우는 모호할 수 있다. 뒤따르는 0들이 유효 숫자인지 아닌지 불분명하기 때문이다. 이를 피하기 위해 과학적 표기법을 사용할 수 있다. 8.0 × 103 m는 첫 번째 0이 유효 숫자임을 나타내며 (오차 한계 50m), 8.000 × 103 m는 세 개의 0이 모두 유효 숫자임을 나타낸다 (오차 한계 0.5m). 또는 기본 단위의 배수를 사용하여 8km로 표기하면 8.0 × 103 m와 같이 오차 한계가 0.05km (즉, 50m)임을 나타낼 수 있다. 그러나 이러한 관례에만 의존하면, 관례를 따르지 않는 출처의 데이터를 사용할 때 잘못된 정밀도(false precision) 오류가 발생할 수 있다.
더 명확하게 오차 한계를 나타내려면 7.54398(23) × 10−10 m와 같은 표기법을 사용하기도 한다. 이는 값이 7.54375 × 10−10 m 와 7.54421 × 10−10 m 사이에 있음을 의미한다.
정밀도는 다음 두 가지로 나눌 수 있다.
- 반복성(repeatability): 동일한 기기와 작업자가 짧은 시간 동안 동일한 조건에서 측정할 때 발생하는 변동성.
- 재현성(reproducibility): 동일한 측정 과정을 다른 기기, 다른 작업자, 또는 더 긴 시간에 걸쳐 사용할 때 발생하는 변동성.
공학에서는 종종 정밀도를 측정값 표준 편차의 3배로 간주하며, 이는 측정값의 99.73%가 포함될 것으로 예상되는 범위를 나타낸다.[8] 예를 들어, 인체 측정에서 특정 처리 시스템을 사용하면 추출된 측정값의 99.73%가 실제 값의 ±0.7cm 이내에 있을 것으로 기대할 수 있다.[9]
정확도와 정밀도의 차이는 과녁 맞히기 비유를 통해 쉽게 이해할 수 있다. 반복 측정은 과녁에 여러 발의 화살을 쏘는 것에 해당한다.
- 정확도는 화살들이 과녁의 중심(실제 값)에 얼마나 가깝게 맞았는지를 나타낸다. 화살들이 평균적으로 중심에 가까울수록 정확도가 높다.
- 정밀도는 여러 발의 화살이 서로 얼마나 가깝게 모여 있는지를 나타낸다. 화살들이 좁은 영역에 집중될수록 정밀도가 높으며, 이것이 과녁 중심에서 얼마나 떨어져 있는지는 상관없다.
정밀도가 높다고 해서 반드시 정확도가 높은 것은 아니다. 하지만 개별 측정값이 신뢰할 수 있을 만큼 정확하다고 말하려면 정밀도가 높아야 한다. 화살들이 여기저기 흩어져 있다면 개별 화살이 중심에 가깝다고 보기 어렵다. 평균적으로는 중심에 가까울 수 있지만, 각 측정값의 정확성은 낮다고 할 수 있다.
이상적인 측정은 정확하고 정밀하여, 모든 측정값이 실제 값에 매우 가깝고 서로 조밀하게 모여 있는 상태이다.
5. 2. 통계학
일반적인 표준에 따른 판정결과